智能论文笔记

Uniform Sequence Better: Time Interval Aware Data Augmentation for Sequential Recommendation

Yizhou Dang , Enneng Yang , Guibing Guo , Linying Jiang , Xingwei Wang , Xiaoxiao Xu , Qinghui Sun , Hong Liu

分类：机器学习

2022-12-16

Sequential recommendation is an important task to predict the next-item to access based on a sequence of interacted items. Most existing works learn user preference as the transition pattern from the previous item to the next one, ignoring the time interval between these two items. However, we observe that the time interval in a sequence may vary significantly different, and thus result in the ineffectiveness of user modeling due to the issue of \emph{preference drift}. In fact, we conducted an empirical study to validate this observation, and found that a sequence with uniformly distributed time interval (denoted as uniform sequence) is more beneficial for performance improvement than that with greatly varying time interval. Therefore, we propose to augment sequence data from the perspective of time interval, which is not studied in the literature. Specifically, we design five operators (Ti-Crop, Ti-Reorder, Ti-Mask, Ti-Substitute, Ti-Insert) to transform the original non-uniform sequence to uniform sequence with the consideration of variance of time intervals. Then, we devise a control strategy to execute data augmentation on item sequences in different lengths. Finally, we implement these improvements on a state-of-the-art model CoSeRec and validate our approach on four real datasets. The experimental results show that our approach reaches significantly better performance than the other 11 competing methods. Our implementation is available: https://github.com/KingGugu/TiCoSeRec.

translated by 谷歌翻译

Robust Split Federated Learning for U-shaped Medical Image Networks

Ziyuan Yang , Yingyu Chen , Huijie Huangfu , Maosong Ran , Hui Wang , Xiaoxiao Li , Yi Zhang

分类：计算机视觉

2022-12-13

U-shaped networks are widely used in various medical image tasks, such as segmentation, restoration and reconstruction, but most of them usually rely on centralized learning and thus ignore privacy issues. To address the privacy concerns, federated learning (FL) and split learning (SL) have attracted increasing attention. However, it is hard for both FL and SL to balance the local computational cost, model privacy and parallel training simultaneously. To achieve this goal, in this paper, we propose Robust Split Federated Learning (RoS-FL) for U-shaped medical image networks, which is a novel hybrid learning paradigm of FL and SL. Previous works cannot preserve the data privacy, including the input, model parameters, label and output simultaneously. To effectively deal with all of them, we design a novel splitting method for U-shaped medical image networks, which splits the network into three parts hosted by different parties. Besides, the distributed learning methods usually suffer from a drift between local and global models caused by data heterogeneity. Based on this consideration, we propose a dynamic weight correction strategy (\textbf{DWCS}) to stabilize the training process and avoid model drift. Specifically, a weight correction loss is designed to quantify the drift between the models from two adjacent communication rounds. By minimizing this loss, a correction model is obtained. Then we treat the weighted sum of correction model and final round models as the result. The effectiveness of the proposed RoS-FL is supported by extensive experimental results on different tasks. Related codes will be released at https://github.com/Zi-YuanYang/RoS-FL.

translated by 谷歌翻译

NeuRIS: Neural Reconstruction of Indoor Scenes Using Normal Priors

Jiepeng Wang , Peng Wang , Xiaoxiao Long , Christian Theobalt , Taku Komura , Lingjie Liu , Wenping Wang

分类：计算机视觉

2022-06-27

在许多计算机视觉和图形应用程序中，从2D图像重建3D室内场景是一项重要任务。这项任务中的一个主要挑战是，典型的室内场景中的无纹理区域使现有方法难以产生令人满意的重建结果。我们提出了一种名为Neuris的新方法，以高质量地重建室内场景。 Neuris的关键思想是将估计的室内场景正常整合为神经渲染框架中的先验，以重建大型无纹理形状，并且重要的是，以适应性的方式进行此操作，以便重建不规则的形状，并具有很好的细节。。具体而言，我们通过检查优化过程中重建的多视图一致性来评估正常先验的忠诚。只有被接受为忠实的正常先验才能用于3D重建，通常发生在平滑形状的区域中，可能具有弱质地。但是，对于那些具有小物体或薄结构的区域，普通先验通常不可靠，我们只能依靠输入图像的视觉特征，因为此类区域通常包含相对较丰富的视觉特征（例如，阴影变化和边界轮廓）。广泛的实验表明，在重建质量方面，Neuris明显优于最先进的方法。

translated by 谷歌翻译

SparseNeuS: Fast Generalizable Neural Surface Reconstruction from Sparse views

Xiaoxiao Long , Cheng Lin , Peng Wang , Taku Komura , Wenping Wang

分类：计算机视觉

2022-06-12

我们介绍了Sparseneus，这是一种基于神经渲染的新方法，用于从多视图图像中进行表面重建的任务。当仅提供稀疏图像作为输入时，此任务变得更加困难，这种情况通常会产生不完整或失真的结果。此外，他们无法概括看不见的新场景会阻碍他们在实践中的应用。相反，Sparseneus可以概括为新场景，并与稀疏的图像（仅2或3）良好合作。 Sparseneus采用签名的距离函数（SDF）作为表面表示，并通过引入代码编码通用表面预测的几何形状来从图像特征中学习可概括的先验。此外，引入了几种策略，以有效利用稀疏视图来进行高质量重建，包括1）多层几何推理框架以粗略的方式恢复表面； 2）多尺度的颜色混合方案，以实现更可靠的颜色预测； 3）一种一致性意识的微调方案，以控制由遮挡和噪声引起的不一致区域。广泛的实验表明，我们的方法不仅胜过最先进的方法，而且表现出良好的效率，可推广性和灵活性。

translated by 谷歌翻译

FINETUNA: Fine-tuning Accelerated Molecular Simulations

Joseph Musielewicz , Xiaoxiao Wang , Tian Tian , Zachary Ulissi

分类：机器学习

2022-05-02

机器学习方法有可能以计算有效的方式近似于原子模拟的密度功能理论（DFT），这可能会大大增加计算模拟对现实世界问题的影响。但是，它们受到其准确性和生成标记数据的成本的限制。在这里，我们提出了一个在线主动学习框架，该框架通过合并了开放催化剂项目的大规模预训练的图形神经网络模型，通过合并了先前的物理信息，从而有效，准确地加速了原子系统的模拟。加速这些模拟使有用的数据更便宜地生成，从而可以训练更好的模型，并可以筛选更多的原子系统。我们还提出了一种基于其速度和准确性比较局部优化技术的方法。 30基准测试吸附剂催化剂系统的实验表明，我们的转移学习方法以预先训练模型合并先前的信息通过将DFT计算的数量减少91％，从而加速模拟，同时达到0.02 EV的准确性阈值93％。。最后，我们展示了一种技术，用于利用VAS中内置的交互式功能，以在我们的在线活动框架内有效地计算单点计算，而无需大量启动成本。这使VASP与我们的框架同时起作用，同时需要比常规的单点计算要少75％。在GitHub的开源Finetuna软件包中可用在线主动学习实现以及使用VASP交互式代码的示例。

translated by 谷歌翻译

The VoicePrivacy 2022 Challenge Evaluation Plan

Natalia Tomashenko , Xin Wang , Xiaoxiao Miao , Hubert Nourtel , Pierre Champion , Massimiliano Todisco , Emmanuel Vincent , Nicholas Evans , Junichi Yamagishi , Jean-François Bonastre

分类：自然语言处理

2022-03-23

对于新参与者 - 执行摘要：（1）任务是为语音数据开发语音匿名系统，该系统隐藏了说话者的语音身份，同时保护语言内容，副语言属性，清晰度和自然性。（2）除3种不同的基线匿名系统，评估脚本和指标外，还提供了培训，开发和评估数据集。参与者应用其开发的匿名系统，运行评估脚本并向组织者提交客观评估结果和匿名语音数据。（3）结果将在与Interspeech 2022结合的研讨会上展示，邀请所有参与者介绍其挑战系统并提交其他研讨会论文。对于熟悉语音挑战的读者 - 更改W.R.T. 2020年：（1）以自动扬声器验证（ASV）系统的形式进行了更强的半信息攻击模型，该系统接受了匿名（每位）语音数据的训练。（2）互补指标包括等于误差率（EER）作为隐私指标，单词错误率（WER）作为主要实用性度量，以及音调相关性和声音独特性作为辅助效用度量标准。（3）基于一组最小目标隐私要求的新排名策略。

translated by 谷歌翻译

GATE: Graph CCA for Temporal SElf-supervised Learning for Label-efficient fMRI Analysis

Liang Peng , Nan Wang , Jie Xu , Xiaofeng Zhu , Xiaoxiao Li

分类：机器学习

2022-03-17

在这项工作中，我们使用功能磁共振成像（fMRI）专注于具有挑战性的任务，神经疾病分类。在基于人群的疾病分析中，图卷积神经网络（GCN）取得了显着的成功。但是，这些成就与丰富的标记数据密不可分，对虚假信号敏感。为了改善在标签有效的设置下的fMRI表示学习和分类，我们建议在GCN上使用新颖的，理论驱动的自我监督学习（SSL）框架，即在FMRI分析门上用于时间自我监督学习的CCA。具体而言，要求设计合适有效的SSL策略来提取fMRI的形成和鲁棒特征。为此，我们研究了FMRI动态功能连接（FC）的几种新的图表增强策略，用于SSL培训。此外，我们利用规范相关分析（CCA）在不同的时间嵌入中，并呈现理论含义。因此，这产生了一个新颖的两步GCN学习程序，该过程包括在未标记的fMRI人群图上的（i）SSL组成，并且（ii）在小标记的fMRI数据集上进行了微调，以进行分类任务。我们的方法在两个独立的fMRI数据集上进行了测试，这表明自闭症和痴呆症诊断方面表现出色。

translated by 谷歌翻译

Region Proposal Rectification Towards Robust Instance Segmentation of Biological Images

Qilong Zhangli , Jingru Yi , Di Liu , Xiaoxiao He , Zhaoyang Xia , Qi Chang , Ligong Han , Yunhe Gao , Song Wen , Haiming Tang

分类：计算机视觉

2022-03-06

自上而下的实例分割框架与自下而上的框架相比，它在对象检测方面表现出了优越性。虽然它有效地解决了过度细分，但自上而下的实例分割却遭受了过度处理问题。然而，完整的分割掩模对于生物图像分析至关重要，因为它具有重要的形态特性，例如形状和体积。在本文中，我们提出了一个区域建议纠正（RPR）模块，以解决这个具有挑战性的分割问题。特别是，我们提供了一个渐进式皇家模块，以逐渐将邻居信息引入一系列ROI。 ROI功能被馈入专门的进料网络（FFN）以进行提案框回归。有了其他邻居信息，提出的RPR模块显示了区域建议位置的校正显着改善，因此与最先进的基线方法相比，在三个生物图像数据集上表现出有利的实例分割性能。实验结果表明，所提出的RPR模块在基于锚固的和无锚的自上而下实例分割方法中有效，这表明该方法可以应用于生物学图像的一般自上而下实例分割。代码可用。

translated by 谷歌翻译

FedNI: Federated Graph Learning with Network Inpainting for Population-Based Disease Prediction

Liang Peng , Nan Wang , Nicha Dvornek , Xiaofeng Zhu , Xiaoxiao Li

分类：机器学习

2021-12-19

图表卷积神经网络（GCNS）广泛用于图形分析。具体地，在医学应用中，GCNS可用于群体图中的疾病预测，其中曲线图节点代表个体，边缘代表个体相似度。然而，GCNS依赖于大量数据，这是对单一医学机构收集的具有挑战性。此外，大多数医疗机构继续面临的危急挑战是用不完全的数据信息分离地解决疾病预测。为了解决这些问题，联合学习（FL）允许隔离本地机构协作，没有数据共享的全局模型。在这项工作中，我们提出了一个框架FEDNI，通过FL释放网络染色和机构间数据。具体地，我们首先使用图形生成的对冲网络（GaN）联接捕获缺少节点和边缘预测器来完成本地网络的缺失信息。然后我们使用联合图形学习平台跨过机构训练全局GCN节点分类器。新颖的设计使我们能够通过利用联合学习和图表学习方法来构建更准确的机器学习模型。我们证明，我们的联邦模式优于本地和基线流动方法，在两个公共神经影像数据集中具有显着的边缘。

translated by 谷歌翻译

BAANet: Learning Bi-directional Adaptive Attention Gates for Multispectral Pedestrian Detection

Xiaoxiao Yang , Yeqian Qiang , Huijie Zhu , Chunxiang Wang , Ming Yang

分类：计算机视觉

2021-12-04

热红外（TIR）图像在为多光谱行人检测提供温度提示时已经证明了有效性。大多数现有方法直接将TIR模型注入基于RGB的框架或简单地集合两个模态的结果。然而，这可能导致较差的检测性能，因为RGB和TIR特征通常具有模态特定的噪声，这可能与网络的传播一起恶化。因此，这项工作提出了一种称为双向自适应注意栅极（BAA门）的有效和高效的跨型号融合模块。基于注意机制，设计了BAA门以蒸馏出信息特征，并重新校验渐近的表示。具体地，采用双向多阶段融合策略来逐步优化两种方式的特征，并在传播期间保持其特异性。此外，通过基于照明的权重策略引入了BAA栅极的自适应相互作用，以便于在BAA栅极中自适应地调整重新校准和聚集强度，并增强稳健性对照明变化。关于挑战性的Kaist DataSet的相当大的实验证明了我们对令人满意的速度的卓越性能。

translated by 谷歌翻译